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Gene des l-Desoxy-D-xylulose-Biosynthesewegs 

Die vorliegende Erfindung betrifft DNA-Sequenzen, die bei Inte- 
gration in das Genom von Viren, Eukaryonten und Prokaryonten 
die Isoprenoid-Biosynthese verandern sowie gentechnologische 
_y:^rf Ahr_ gm_^^u_r^p r-c^t-^i 1 nn g: dles_er,,tiraa_saen^ejLjVi__ren , Eukaryonten 



und Prokaryonten. Aufierdem betrifft sie Verfahren zur Identifi- 
ziereung von Stoffen mit herbizider, antimikrobieller, antipa- 
rasitarer, antiviraler, fungizider, bakterizider Wirkung bei 
Pflanzen und antimikrobieller, antiparasitarer, antimykoti- 
scher, antibakterieller und antiviraler Wirkung bei Mensch und 
ier . 




Der Biosyntheseweg zur Bildung von Isoprenoiden uber den klas- 
sischen Acetat/ Mevalonat-Weg und einen alternativen, Mevalo- 
nat-unabhangigen Biosyntheseweg, den Desoxy-D-xylulose- 
Phosphat-Weg, ist bereits bekannt (Rohmer, M. , Knani, M. , Simo- 
nin. P., Sutter, B., and Sahm, H. (1993): Biochem. J. 295: 517- 
524). 

Es ist aber nicht bekannt, wie und uber welche Wege in Viren, 
Eukaryonten und Prokaryonten eine Anderung der Isoprenoidkon- 
zentration uber den Desoxy-D-xylulose-Phoshat-Weg erreicht wer- 
den kann. In Fig. 1 ist dieser Biosyntheseweg dargestellt. 

Es werden daher DNA-Sequenzen zur Verfugung gestellt, die fur 
die l-Desoxy-D-xylulose-5-phosphat-Synthase (DOXP-Synthase) , : 
l-Desoxy-D-xylulose-5-phosphatreduktoisomerase (DOXP- 
Reduktoisomerase) oder das essentielle gcpE-Protein kodieren. 
Alle drei Gene und Enzyme sind an der Isoprenoid-Biosynthese 
beteiligt. 

Das gcpE-Protein hat zusatzlich noch eine Kinasef unktion und 
katalysiert die Phosphorylierung eines Zuckers oder eines Phos- 
phorzuckers oder einer Vorstufe der Isoprenoidbiosynthese^ ins- 
besondere die Phosphorylierung von 2-C-Methyl-D-erythritol^ 2- 
C-Methyl-D-erythritol-phosphat, insbesondere 2-C-Methyl-D- 



u K ,- 7 r-Methvl-D-erythrose, 2-C-Methyl-D- 
erythritol-4-phosphat, 2-C Methyl ^ ,^3^.,. 

rar::::re:: r .....ue.. .e. .... 

CH. ,0H, -C ,-CH., -C (OH, -CH.-O-PO ,0H, ^'C"^ '°«^ 'ch^h, CH -OH. 
CHO-CH ,CH,) -CH (OH, -CH.-O-PO (OH, ^. ^» .^„^„.o„ 

I. O0.-Sy..a=. .a.a.y...t ..e^-^^^^^^^^^^ 
Glycaraldehyd-3-phosphat zu Deo y y ^^^^^^^^ 

Deoxy-O-xyl.ulose-5-phosphat zu 2-C Methyl y 
phosphat. (siahe Fig. D ■ 

^ K^frfftt die folqenden DNA-Sequenzen: 
Die Erfindung betrifft die lo si in SEO ID NO: 2 

filr ein Polypeptid mit der in sty 
DNA-Sequehzen, die tur ein eln Ahaloges 

dargesteUten A.inos.ureseguenz "^--"^ „aer 
„de. Oe.ivat des = 

rr.r=rr:::d;n .... - - 

' irlcun, des Polypeptids wesentlich zu reduzieren, 
0«A-Seguenze„. die fa. ein Polypeptid ™it der - -Q ID HO-^^ 
dacgestellten -----=;:-":;;;r.r D 0 ^ -"n eine ode. 
Ode. De.ivat des -^^Pf^--^J7/„,: °, ,,er du.ch andere 
=ur=rr:::d;n s^d, ohne d. enzy^tis^e 
Wir,cung des Polypeptids wesentlich zu reduzieren, 

sowie DNA-Sequenzen. die fOr ein PoXypeptid »it der In SEO ID 
H0:6 dar,estellt.n =:^^:^riD NO: ! «orin ei- 
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andere Aainosau^en substituxert «.den sind, ohne die eazyllti- 
3che „..kun, des Polypeptide wesenUlch reduzleren. 

ToVlTLTV''" "^"^"^""'^ (Polypeptide, sind i. Sequenzpro- 

SEO T. 21- r°"°='^-°-'=^^"^°^^-^-P*'-P»atredu.tol3o»erase-Gen 

s'q id no . -""-y-°-yl"l°^:^3;hat-Syntha3e-Ge,; 

SEO '■'"=°='^-''-'=^^"l--5-phosphat-Syntha.e 
5EQ ID NO: 5: gcpE-Gen 

SEQ ID NO: 6: gcpE-Protein. 




Die DNA-sequenzea stamen alle aus Plasmodium (alclparoM. 

Au3er den i. Sequenzproto.oll genannten DNA-Se<^enze„ si„d auch 
^olche gee.gnet, die .ntolge der Degeneration des genetlsohen 
codes exne ande.e DNA-Seguenz besltzen, Jedoch £a. das g eil 
Polvpept.d Oder «r eln Analoges Oder Derlvat des Polypep ds 
ge.a8 worxn e.ne Oder mehrere AMlnos.uren deletiert, wLuge- 
fugt Oder durch andere A.inos.uren substltulert word;n sLd 
ohnejla enzy^atlsche Wir.ung des Polypeptide wesentUch re- 
Die erfindungsgemaeen Sequenzen eignen slch fUr die Expression 
von 3enen in viren, Eu.aryonten und Prokaryonten, die fur" e 
llT7:r'°''"'''''' 1-esoKy-D-xyluIose-Wegs verant'Lt- 

Erflndungsge..B-geh«ren zu den Eukaryonten Oder eukaryontischen 
Zellen tler.achen Zellen, Pf lanzenzellen, Algen, He J, PiUe 
und zu den Prokaryonten oder pro.aryontischen Ba.terien Archae- 
bakterien und Eub.akterien. * 

Bel integration einer DNA-Sequenz in eln Genom, auf der eine 
der oben angegebenen DNA-Sequenzen lokalisiert 1st, wird die 
EKpressron der oben beschrlebenen Gene in Viren, Eu.aryonten 
und Pro.aryonten er^Oglicht. Die erfindungsgeaaa transformer- 
ten Viren, Eukaryonten und Prokaryonten werden in an sich be- 
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kannter Weise gezuchtet und das wahrenddessen gebildete Isopre- 
noid isoliert und gegebenenf alls gereinigt. Nicht alle Isopre- 
noide miissen isoliert werden, da die Isoprenoide in einigen 
Fallen direkt in die Raumluft abgegeben werden. 

Die Erfindung betrifft ferner ein Verfahren zur Herstellung von 
transgenen Viren, Eukaryonten und Prokaryonten zur VerSnderung 
isoprepnid-Gehalte-s. das die f olgenden „Schritte enthalt. , 



iii) 




a) Herstellung einer DNA-Sequenz mit folgenden Teilsequenzen 

i) Promotor, der in Viren, Eukaryonten und Prokaryonten 
aktiv ist und die Bildung einer RNA im vorgesehenen 
Zielgewebe oder den Zielzellen sicherstellt, 

ii) DNA-Sequenz, die fUr ein Polypeptid mit der in SEQ ID 
NO: 2, 4 Oder 6 dargestellten Aminosauresequenz codieren 
Oder fur ein Analoges oder Derivat des Polypeptids ge- 
mafi SEQ ID NO: 2, 4 oder 5, 

3'-nichttranslatierte Sequenz, die in Viren, Eukaryon- 
ten und Prokaryonten zur Addition von Poly-A Resten an 
das 3'-Ende der RNA fuhrt, 

b) Transfer und Einbau der DNA-Sequenz in das Genom von Viren, 
prokaryontischen oder eukaryontischen Zellen mit oder ohne 
Verwendung eines Vektors (z.B. Plasmid, virale DNA) . 



Aus ^'transfontiierten Pf lanzenzellen konnen die intakten gan- 
zen Pflanzen regeneriert werden. 

Die fUr die Proteine kodierenden Sequenzen der Proteine mit den 
Nukleotidabfolgen Seq ID N0:1, Seq ID NO: 3 und Seq ID NO: 5 
konnen mit einem die Transkription in bestimmten Organen oder 
Zellen sicherstelleneden Promotor versehen werden, der in sen 
se-Orientierung (3'-Ende des Promotors zum 5^-Ende der kodie- 
renden Sequenz) an die Sequenz, die das zu bildende Protein ko- 
diert, gekoppelt ist. An das 3*-Ende der kodierenden Seqeunz 
wird ein die Termination der mRNA-Synthese bestimmendes Termx- 
nationssigrial angehangt. Um das zu exprimierende Protein in be- 
stimmte subzelluiare Kompartimente, wie Chloroplasten, Amy- 
loplasten, Mitochondrien, Vakuole, Cytosol oder Interzellu- 
larraume zu dir'igieren, kann zwischen den Promotor und die ko- 




dierende Sequenz noch eine fur eine sogenannte Signalsequenz 
Oder ein Transitpeptid kodierende Sequenz gesetzt werden. die 
Sequenz muli im gleichen Leserahmen wie die kodierende Sequenz 
des Proteins sein. Zur Vorbereitung der Einftihrung der erfin- 
dungsgemaflen DNA-Sequenzen in hohere Pflanzen sind eine grolie 
Anzahl von Klonierungsvektoren verfugbar, die ein Replikations- 
signal fur E.coli und einen Marker beinhalten, der eine Selek- 
■tion der„ trans formierte n Zellen erlaubt. Beispiele fur Vektoren 




sind pBR 322, pUC-Serien, M13mp-Serien, pACYC 184, EMBL 3 usw, 
Je nach Einfuhrungsmethode gewunschter Gene in die Pflanze kon- 
nen weitere DNA-Sequenzen erforderlich sein. Werden zum Bei- 
spiel fiir die Transformation der Pflanzenzelle das Ti- oder Ri- 
Plasmid verwendet, so muii mindestens eine rechte Begrenzung, 

aufig jedoch die rechte und die linke Begrenzung der Ti- und 
Ri-Plasmid T-DNA als Flankenbereich den einzufuhrenden Genen 
eingefugt werden. Die Verwendung von T-DNA fur die Transforma- 
tion von Pflanzenzeilen ist intensiv untersucht und ausreichend 
in EP 120516; Hoekama, in: The Binary Plant Vector System, 
Of fset-drukkerij Kanters B.V. Alblasserdam (1985), Chapter V; 
Fraley et al., Crit . Rev. Plant Sci. 4,1-46 und An et al. (1985) 
EMBO J. 4, 277-287 beschrieben worden. Ist die eingefuhrte DNA 
einmal im Genom integriert, so ist sie in der Regel stabil und 
bleibt auch in den Nachkommen der ursprunglich transformierten 
Zellen erhalten. Sie erhalt normalerweise einen Selektionsmar- 
ker, der den transformierten Pflanzenzeilen Resistenz gegeniiber 
einem Biozid oder einem Antibiotikum, wie Kanamycin, G 418, 

leomycin, Hygromycin oder Phosphinotricin u.a. vermittelt. Der 
individuell verwendete Marker sollte daher die selektion trans- 
formierter Zellen gegenuber Zellen, denen die eingefugte DNA 
fehlt, gestatten. 

Ftir die Einfuhrung von DNA in eine Pflanze stehen viele Techni- 
ken zur VerfUgung. Diese Techniken umfassen die Transformation 
mit Hilfe von Agrobakterien, z.B. Agrobacterium tumefaciens , 
die Fusion von Protoplasten, die Mikroinjektion von DNA, die 
Elekroporation, sowie ballistische Methoden und die Virusinfek- 
tion. Aus dem transformierten Pf lanzenmaterial kdnnen dann im 
geeigneten Medium, welches Antibiotika oder Biozide zur Selek- 
tion enthalten kann, wieder ganze Pflanzen regeneriert werden. 



Bei der Injektion und Elektroporation sind an sich keine spezi- 
eilen Anforderungen an die Plasmide gestellt. Sollen aber aus 
derartig trans formierten Zellen ganze Pflanzen regeneriert wer- 
den, ist die Anwesenheit eines selektierbaren Markergens not- 
wendig. Die trans formierten Zellen wachsen innerhalb der Pflan- 
zen in der iiblichen Weise (McCormick et al. (1986), Plant Cell 
Reports 5, 81-84) . Die Pflanzen kQnnen normal angezogen werden 
und mit Pflanzen, die die gleiche trans formierte Erbanlage 'oder 
andere Erbanlagen haben, gekreuzt werden. Die daraus entstehen- 
den Individuen haben die entsprechenden phSnotypischen Eigen- 
schaften. 





Weiterhin sind Gegenstand der Erfindung Expressionsvektoren, 
die eine oder mehrere der erf indungsgemafien DNA-Sequenzen ent- 
halten. Solche Expressionsvektoren erhait man, indem man die 
erfindungsgemalien DNA-Sequenzen mit geeigneten funktionellen 
Regulationssignaien versieht. Seiche Regulationssignale sind 
DNA-Sequenzen, die fiir die Expression verantwortlich sind, bei- 
spieisweise Promocoren, Operatoren, Enhancer, ribosomale Bin- 
dungsstellen, und die vom Wirtsorganismus erkannt werden. 

Gegebenenfalls konnen noch weitere Regulationssignale, die^bei- 
spielsweise Replikation oder Rekombination der rekombinanten 
DNA im Wirtsorganismus steuern, Bestandteil des Expressionsvek- 
tors sein. 

Ebenso gehoren die mit den erf indungsgemSBen DNA-Sequenzen oder 
Expressionsvektoren trans formierten Wirtsorganismen zum Gegen- 
stand der Erfindung. 

Far die Expression der erfindungsgemalien Enzyme eignen sich be- 
sonders solche Wirtszellen und Organismen, die keine intrinsi- 
schen Enzyme mit der Funktion der DOXP-Synthase, der DOXP- 
Reduktoisomerasg oder des gcpE-Proteins aufweisen. Dies trifft 
far Archaebacterien, Tiere, Pilze, Schleimpilze und einige Eu- 
bakterien zu. Durch das Fehlen dieser intrinsischen Enzymakti- 
vitaten wird die Detektion und Aufreinigung der rekombinanten 
Enzyme wesentlich erleichtert. Auch wird es erst dadurch mSg- 
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lich, mit geringem Aufwand die Aktivitat und insbesondere die 
Hemmung der Aktivitat der erf indungsgemalien rekombinanten Enzy- 
me durch verschiedenen Chemikalien und Pharmaka in Rohextrakten 
aus den Wirtszellen zu messen. 



Die Expression der erf indungsgemalien Enzyme erfolgt vorteilhaf- 
terweise dann in eukaryontischen Zellen, wenn posttranslatori- 
sche Modif ikationen und eine native Faitung der Poiypeptidkette 
erreicht werden soil. AuBerdem wird in Abhangigkeit vom Expres- 
sionssystem bei der Expression genomischer DNA-Sequenzen er- 
reicht, dafi Introns durch SpleiBen der DNA beseitigt und die 
^nzyme in der fiir die Parasiten charakteristischen Polypep- 
P:idsequenz produziert werden. Fur Introns codierende Sequenzen 
konnen auch durch rekombinante DNA-Technologie aus den _zu ex- 
primierenden DNA-Sequenzen beseitigt oder experimentell einge- 
fiigt werden. 

Die Isolierung des Proteins kann aus der Wirtszelle oder dem 
Kulturuberstand der Wirtszelle nach dem Fachmann bekannten Ver- 
fahren erfolgen. Es kann auch ^eine in vitro Reaktivierung der 
Enzyme erforderlich sein. 




Zur Erleichterung der Aufreinigung konnen die erf indungsgemafien 

nzyme oder Teilsequenzen der Enzyme als Fusionsprotein mit 
verschiedenen Peptidketten exprimiert werden. Dazu eigenen sich 
besonders Oligo-Histidin-Sequenzen und Sequenzen, die von der 
Glutathion-S-Transferase, Thioredoxin oder Calmodulin-bindenden 
Peptiden abgeleitet sind. Fusionen mit Thioredoxin-abgeleiteten 
Sequenzen eignen sich besonders fur prokaryontische Expression, 
da dadurch die LQslichkeit der rekombinanten Enzyme erhOht 
wird. 



Weiterhin kSnnen die erf indungsgemalien Enzyme oder Teilsequen- 
zen der Enzyme als Fusionsprotein mit solchen, dem Fachmann be- 
kannten, Peptidketten exprimiert werden, daB die rekombinanten 




Enzyme in das extrazellulSre Millieu oder in bestimmte Kompar- 
timente der Wirtszellen transportiert warden. Dadurch kann so- 
wohl die Auf reinigung, als auch die Untersuchung der biologi- 
schen Aktivitat der Enzyme erleichtert werden. 

Bei der Expression der erf indungsgemaiien Enzyme kann es sich 
als zweckmafiig erweisen, einzelne Codone zu verandern. Dabei 
ist der gezielte Austausch von Basen in der kodierenden Region 
auch sinnvoll, wenn die genutzten Codone in den Parasiten ab- 
weichend sind von der Codonnutzung im heterologen Expressions- 
system, urn eine optimale Synthese des. Proteins zu gewahrlei- 
ten. Zudem sind oft Deletionen von nicht-translatierten 5'bzw. 
' -Abschnitten sinnvoll, beispielsweise wenn mehrere destabili- 
sierende Sequenzmot ive ATTTA Lm 3'-Bereich der DNA vorliegen. 
Dann sollten diese bei der bevorzugen Expression in Eukaryonten 
deletiert werden. Veranderungen dieser Art sind Deletionen, Ad- 
ditionen oder Austausch von Basen und ebenfalls Gegenstand der 
voriiegenden Erfindung. 

Weiterhin konnen die erf indungsgemalben Enzyme unter standardi- 
sierten Bedingungen durch dem Fachmann bekannte Techniken durch 
in vitro-Translation gewonnen werden. Dafur geeignete Systeme 
sind Kaninchen-Reticulozyten- und Weizenkeimextrakte und Bakte- 
ienlysate. Auch kann in vitro transskribierte mRNA in Xenopus- 
bocyten translatiert werden. 

Durch chemische Synthese kSnnen Oligo- und Polypeptide herge- 
stellt werden, der Sequenzen aus der Peptidsequenz der erfin- 
dungsgemaOen Enzyme abgeleitet sind. Bei geeigneter Wahl der 
Sequenzen besitzen derartige Peptide Eigenschaf ten, die fUr die 
vollstandigen erf indungsgemafien Enzyme charakteristisch sind. 
Derartige Peptide konnen in groBen Mengen hergestellt werden 
und eignen sich besonders fUr Studien Ober die Kinetik der En- 
zymaktivitat, die Regulation der Enzymaktivitat, die dreidimen- 
sionale Struktur der Enzyme, die Hemmung der Enzymaktivitat 




durch verschiedenen Chemikalien und Pharmaka und die Bindungs- 
geometrie und Bindugnsaf f initat verschiedener Liganden. 



Vorzugsweise wird zur rekombinanten Herstellung der erfindungs- 
gemalien Enzyme eine DNA mit den Nukleotiden aus den Sequenzen 
SEQ ID NO: 1, 3 und 5 verwendet, 

deia die ser-Anme^dun g zugrun d eliegenden P i ioi i tratsdoku- 
ment beschrieben, hat sich herausgestellt, dafl in vielen Para- 
siten, Bakterien, Viren und Pilzen dieser der Desoxy-D- 
xylulose-Phosphat-Stoffwechselweg ebenfalls vorliegt. 

^^^^Die Erfindung umfaBt daher aufierdem ein Verfahren zum Screening 
^^^einer Verbindung. Gemafi diesem Verfahren wird ein Wirtsorganis- 
mus, der einen rekombinanten Expressionsvektor enthalt, wobei 
der Vektor zumindest einen Teil der Olignukleot idsequenz gemafi 
SEQ ID NO: I, SEQ ID NO: 3 oder SEQ ID NO: 5 Oder Varianten Oder 
Homoioge dieser aufweist, und aufierdem eine Verbindung, von der 
vermutet wird, dafi sie eine antimikrobielle, antiparasitare, 
antibakterielle, antivirale und antimykotische Wirkung bei 
Mensch und Tier oder eine antimikrobielle, antivirale, bakteri- 
zide, herbizide oder fungizide Wirkung bei Pflanzen hat, be- 
reitgestellt . Anschlieflend wird der Wirtsorganismus mit der 
Verbindung in Kontakt gebracht und die Wirksamkeit der Verbin- 

^ dung bestimmt. 

^^^Ein weiterer Gegenstand dieser Erfindung sind Methoden zur Be- 
stimmung der enzymatische Aktivitat des gcpE-Proteins . Diese 
kann nach den bekannten Anleitungen bestimmt werden. Hierbei 
wird die Phosphorylierung eines Zuckers oder eines Phosphorzuk- 
kers Oder einer Vorstufe der Isoprenoidbiosynthese, insbeson- 
dere die Phosphorylierung von 2-C-Methyl-D-erythritol, 2-C- 
Methyl-D-erythritol"phosphat, insbesondere 2-C-Methyl-D- 
erythritol-4"phosphat, 2-C-Methyl-D-erythrose, 2-C-Methyl-D- 
erythrose-phosphat, insbesondere 2-C-Methyl-D-erythrose-4- 
phosphat, detektiert. Ein weiterer Gegenstand dieser Erfindung 
ist die Verwendung dieser Meflverfahren zur Ermittlung von Stof- 
fen, die die Aktivitat der jeweiligen Enzyme inhibieren. 




Analog erfolgt die Bestimmung der Aktivitaten von DOXP-Synthase 
und DOXP-Reduktoisomerase. Fur die Bestimmung der DOXP- 
Synthase-Aktivitat eignen sich auch f luorimetrische Verfahren, 
wie von Querol at al. beschrieben (Querol et al. Abstracts 4*= 
european symposiiam on plant isoprenoids, Barcelona 21-23 April 
1999) . 



Sequenzprotokoil 



Anzahl der Sequenzen: 6 
(1) ANGABEN ZU SEQUENZ ID NO: 1 

Plasmodium falciparum l-Desoxy-D-xylulose-5-phosphatredukto- 
i some rase (dxr ) gen 




(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1467 BASENPAARE 

(B) ART: Nukleotidsequenz 

(C) STAMM: HB3 
ii) ART DES MOLEKOLS: DNA 

(iv) URSPRONGLICHE HERKUNFT: 
(A) ORGANISMUS: Plasmodium falciparum 
(ix) MERKMAL 

(A) NAME/SCHLUSSEL: mRNA 

(B) LAGE: 1. . . 1467 
GEN=dxr 

PR0DUKT=l-Desoxy-D-xylulose-5-phosphatreduktoisomerase 
MERKMAL 

(A) NAME/SCHLOSSEL: Gen 

(B) LAGE: 1. . .14 67 
GEN=dxr 

(ix) MERKMAL 

) NAME/SCHLOSSEL: CDS 
(B) LAGE: 1. . .1467 
GEN=dxr 

FUNKTION: bei der Isopentenyldiphosphatbiosynthese betei- 
ligt 

(xi) SEQUENZBESCHREIBUNG: SEQ ID N0:1 



ATG AAG AAA TAT ATT TAT 
Met Lys Lys Tyr lie Tyr 

5 

AAT GAT TTA GTA ATA AAT 
Asn Asp Leu Val lie Asn 
20 

AGA AAA AAT AAC GCA TAT 
Arg Lys Asn Asn Ala Tyr 
35 



ATA TAT TTT TTC TTC ATC 
lie Tyr Phe Phe Phe lie 
10 

AAT ACA TCA AAA TGT GTT 
Asn Thr Ser Lys Cys Val 
25 

ATA AAT TAT GGT ATA GGA 
lie Asn Tyr Glu lie Glu 
40 



ACA ATA ACT ATT 48 
Thr lie Thr He 
15 

TCC ATT GAA AGA 96 
Ser lie Glu Arg 
30 

TAT AAT GGA CCA 144 
Tyr Asn Glu Pro 
45 
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rvrt i 


AAA 
AAA 


ATA 
nin 


APA 


AAG 


AGT 


AGA 


AGA 


TGT 


AAA 


AGA 


ATA 


AAG 


TTA 


TGC 


192 


Asp 


A Q n 


Lys 


lie 


Thr 


Lys 


Ser 


Ara 


Arg 


Cys 


Lys 


Arg 


He 


Lys 


Leu 


Cys 












55 










60 










240 


a 2\ 2^ 


HAij 


naT 

OA i 


TTA 
1 In 


ATA 
n 1 n 


f;AT 


ATT 


GGT 


GCA 


ATA 


AAG 


AAA 


CCA 


ATT 


AAT 


GTA 




Lys 


Asp 


Leu. 


lie 


Asp 


lie 


Glu 


Ala 


lie 


Lys 


Lys 


Pro 


He 


Asn 


Val 




















75 










80 


288 




ATT 
Al 1 


TTT 
111 


rtftA 

V7UA 


nv9 X 


ACT 


GGT 


AGT 


ATA 


GGT 


ACG 


AAT 


GCT 


TTA 


AAT 


ATA 


Ala 


T 1 £i 

116 




Pin 


Q a 1^ 

oex 


Thr 

X ilX 


Glu 


Ser 


lie 


Glu 


Thr 


Asn 


Ala 


Leu 


Asn 


He 










O O 










90 










95 




336 


Ai A 


AtjLy 


PAP 
oAo 


TfZT 
1 o 1 


AAT 
nn X 


AAA 


ATT 


GAA 


AAT 


GTT 


TTT 


AAT 


GTT 


AAA 


GCA 


TTG 




Arg 


VJX u 


Cys 


Asn 


Lys 


lie 


Glu 


Asn 


Val 


Phe 


Asn 


Val 


Lys 


Ala 


Leu 


























110 














■I no 

lUU 










105 
















384 


T TV T 


ol o 


aaT 

AAl 


A Aft 
AAv3 


AftT 
nvj X 




AAT 


GAA 


TTA 


TAT 


GAA 


CAA 


GCT 


AGA 


GAA 


TTT 


Tyr 


V ax 


a e n 
noil 


Lys 


Ser 


Val 


Asn 


Glu 


Leu 


Tvr 


Glu 


Gin 


Ala 


Arg 


Glu 


Phe 






113 








120 










125 








432 


TTZV 


pr*A 


nA A 
VjAA 


TAT 
1 Al 


TTft 

X X V7 


TGT 


ATA 


CAT 


GAT 


AAA 


AGT 


GTA 


TAT 


GAA 


GAA 


TTA 


T A1 1 


irx u 


V3X U 


Tyr 


Leu. 


Cys 


lie 


His 


Asp 


Lys 


Ser 


Val 


Tyr 


Glu 


Glu 


Leu 






1 jU 








135 










140 










480 




r'A A 
oAA 


pTrz 


ftTA 

V3 1 A 


AAA 
nnn 


AAT 
nn X 


ATA 


AAA 


GAT 


TAT 


AAA 


CCT 


ATA 


ATA 


TTG 


TGT 


■jys 


VjXu 


Lsu 


VclX 


Lys 


A Q n 
no 11 


lie 


Lys 


Asp 


Tvr 


Lvs 


Pro 


He 


He 


Leu 


Cys 












1 3 










155 










160 


528 


Ljo i 




r:A A 




ATft 
n 1 \j 


AAA 


GAA 


ATA 


TGT 


AGT 


AGT 


AAT 


AGT 


ATA 


GAT 


AAA 


m n 


Asp 


VJX LI 


W X Ll 


Mp r 


Lys 


Glu 


lie 


Cvs 


Ser 


Ser 


Asn 


Ser 


He 


Asp 


Lys 










1 O J 










170 










175 




576 


n Ta 
rV i A 


oil 


ATT 
All 


ftr;T 

1 


ATT 


GAT 


TCT 


TTT 


CAA 


GGA 


TTA 


TAT 


TCT 


ACT 


ATG 


TAT 


Lie 


1 


lie 


Ijl U. 


L X 


Asp 


Ser 


Phe 


Gin 


Glu 


Leu 


Tyr 


Ser 


Thr 


Met 


Tyr 










1 Q n 

I 0 u 








185 










L90 






624 




ATT 
AIL 


aTH 

A 1 vj 


nrt 1 


AAT 




ATA 


GTT 


GCG 


TTA 


GOT 


AAT 


AAA 


GAA 


TCC 


ATT 


r\X a. 


lie 


Mo 1- 

L*ie u 


a Q n 
no ii 


a n 
no i I 


Lys 


lie 


Vai 


Aia 


Leu 


Aia 


Asn 


Lys 


Glu 


Ser 


Eie 








1 ^ D 










200 










205 








672 


VJ i ^ 


1 1 


nPT 


Ov7 1 


TTr 


TTT 


TTA 


AAG 


AAA 


TTA 


TTA 


AAT 


ATT 


CAT 


AAA 


AAT 


V d X 


oe 1 


a 1 A 

riX ct 


O X LI 




Phe 


Leu 


Lys 


Lvs 


Leu 


Leu 


Asn 


lie 


His 


Lys 


Asn 






^ 1 u 










215 










220 










720 




A A^ 
AAij 


ATA 
Al A 


ATA 
Axn 


PPT 


GTT 

VJ X X 


GAT 


TCA 


GAA 


CAT 


AGT 


GCT 


ATA 


TTT 


CAA 


TGT 


AX a 


Lys 


1 xc 


Tip 
X X c 


X w 


Val 


Asp 


Ser 


Glu 


His 


Ser 


Ala 


He 


Phe 


Gin 


Cys 






















235 










240 


768 




VjAI 


A AT 
AAl 


AAT 
nnl 


AAf? 
nnw 


GTA 


TTA 


AAA 


ACA 


AAA 


TGT 


TTA 


CAA 


GAC 


AAT 


TTT 


oil 


Asp 


A Q n 
noil 


A Q n 
no 11 


JJ o 


Val 


Leu 


Lvs 


Thr 


Lvs 


Cys 


Leu 


Gin 


Asp 


Asn 


Phe 










^ 1 «7 










250 










255 




816 




AAA 
AAA 


ATT 
Al 1 


AAP 


AAT 
nnx 


ATA 


AAT 


AAA 


ATA 


TTT 


TTA 


TGT 


TCA 


TCT 


GGA 


GGT 




Lys 


Tie* 
X X c 


A 

no 11 


A^n 


lie 


Asn 


Lvs 


lie 


Phe 


Leu 


Cys 


Ser 


Ser 


Glu 


Glu 


















265 










270 






864 




rnrprp 
111 


PA A 


AAT 
nnx 


TTA 
X xn 


APT 
nv^ X 


ATG 


GAC 


GAA 


TTA 


AAA 


AAT 


GTA 


ACA 


TCA 


GAA 


t I. AJ 




m n 

vjx 11 


A 

no*i 1 




Thr 


Met 


Asp 


Glu 


Leu 


Lys 


Asn 


Val 


Thr 


Ser 


Glu 








97 ^ 










280 










285 








912 


AMI 


VjV^ 1 


TTA 
1 in 


AAft 
nno 


PAT 
^H^n X 


CCT 


AAA 


TGG 


AAA 


ATG 


GGT 


AAG 


AAA 


ATA 


ACT 


ATA 




Ala 


w U 


Lys 


His 


Pro 


Lys 


Trp 


Lvs 


Met 


Glu 


Lys 


Lys 


He 


Thr 


He 














295 










300 










960 




TPT 


ftp A 
w wn 


APT 


ATG 
nx w 


ATG 

fix w 


AAT 


AAA 


GGT 


TTA 


GAG 


GTT 


ATA 


GAA 


ACC 


CAT 


A 


OCX 


Ala 
nxa 


Thr 

X IIX 


Met: 
1 ic ^ 


Met 


Asn 


Lys 


Glu 


Leu 


Glu 


Val 


He 


Glu 


Thr 


His 














310 

<J X w 










315 










320 


1008 


111 


TTA 
1 1 A 


111 


ftAT 

OAX 


ftTA 
vjxn 


GAT 
wnx 


TAT 


AAT 


GAT 


ATA 


GAA 


GTT 


ATA 


GTA 


CAT 


AAA 


Ph^ 
Irilc 


JLiCLl 


Ph^ 


Asp 


Val 


Asp 


Tvr 

X JX 


Asn 


Asp 


lie 


Glu 


Val 


He 


Val 


His 


Lys 




















330 










335 




1056 


ft A A 


1 


ATT 
Al 1 


ATA 
nXn 


PAT 


TCT 

X w X 


TGT 


GTT 


GAA 


TTT 


ATA 


GAC 


AAA 


TCA 


GTA 


ATA 


ft! 11 


Cys 


X X c 


Tlf» 
X xc 


His 
nx o 


Ser 


Cys 


Val 


Glu 


Phe 


He 


Asp 


Lys 


Ser 


Val 


He 


















345 










350 









13 - 



AGT 
Ser 

ACA 
Thr 

CAG 
Gin 
385 
TGT 
Cys 



CAA ATG TAT 
Gin Met Tyr 
355 

TGG CCT GAT 
Trp Pro Asp 
370 

GTT TCA ACT 
Val Ser Thr 

ATT AAA TTA 
lie Lys Leu 



TAT CCA GAT 
Tyr Pro Asp 



AGA 
Arg 

CTT 
Leu 

GCT 
Ala 



ATA 
He 

ACA 
Thr 
390 
TAT 
Tyr 



AAA 
Lys 
375 
TTT 
Phe 

CAA 
Gin 



ATG 
Met 
360 
ACA 
Thr 

CAT 
His 

GCA 
Ala 



CAA 
Gin 

AAT 
Asn 

AAA 
Lys 

GGT 
Glu 



ATA 
He 

TTA 
Leu 

CCT 
Pro 

ATA 
He 



CCC ATA TTA TAT TCT TTA 1104 
Pro lie Leu Tyr Ser Leu 
365 

AAA CCT TTA GAT TTG GCT 1152 
Lys Pro Leu Asp Leu Ala 
380 

TCT TTA GAA CAT TTC CCG 1200 

Ser Leu Glu His Phe Pro 

395 400 

AAA GGA AAC TTT TAT CCA 1248 

Lys Glu Asn Phe Tyr Pro 



GCG 
Ala 



GCT 
Ala 



TCT 
Ser 

GAA 
Glu 

GCC 
Ala 



=«5- 
TTG 
Leu 



GTT 
Val 

TTA 
Leu 

ACC 
Thr 



ACT 
Thr 

AAT 
Asn 



GAA 
lu 



AAG 
Lys 
465 
ATA 

He 



GTA 
Val 

AAA 

Lys 

TCT 
Ser 

450 
CAA 
Gin 



CTA 
Leu 

ATT 
He 
435 
TTC 
Phe 



AAT 
Asn 
420 
AAA 
Lys 

AAT 
Asn 



TCA AAT 
Ser Asn 



ATT CTA 
He Leu 



TAC AAC AAA 
Tyr Asn Lys 



TAT TTT GAT 
Tyr Phe Asp 

TCT CAA AAG 
Ser Gin Lys 

455 

CAA ATA CAT 
Gin He His 
470 

CAT AAT TCT 
His Asn Ser 
485 



GAA 
Glu 

ATT 
He 
440 
GTT 
Val 

TCT 
Ser 

TCA 
Ser 



ATA 
He 
425 
TCC 
Ser 

TCG 
Ser 

TGG 
Trp 

TAG 



AAC AAC 
Asn Asn 

ATA ATA 
He He 

AAT AGT 
Asn Ser 

460 
AAA GAT 
Lys Asp 
475 



TTA 
Leu 

TCG 
Ser 
445 
GAA 
Glu 



TTT 
Phe 
430 
CAA 
Gin 

GAT 
Asp 



AAA GCT 
Lys Ala 



AAT 
Asn 

CTT 
Leu 

ATG 
Met 

GAT 
Asp 
480 



1296 



1344 



1392 



1440 



14 67 



(2) Angaben zu Sequenz ID No: 2 
( i ) Sequenz kennzeichen : 

(A) L^nge: 488 Aminosauren 

(B) Art: Aminosaure 

^ (ii) Art des Molekuls: Protein 

• iii) Urspriingliche Herkunft: 
(A) ORGANISMUS: Plasmodium falciparum; (Apicomplexa) 
STAMM: KB 3 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2 



Met 


Lys 


Lys 


Tyr 


He 


Tyr 


He 


Tyr Phe 


Phe 


Phe 


He 


Thr 


He 


Thr 


He 


1 










5 








10 








15 




Asn 


Asp 


Leu 


Val 


lie 


Asn 


Asn 


Thr Ser 


Lys 


Cys 


Val 


Ser 


He 


Glu 


Arg 








20 








25 










30 






Arg 


Lys 


Asn 


Asn 


Ala 


Tyr 


He 


Asn Tyr 


Gly 


He 


Gly 


Tyr 


Asn 


Gly 


Pro 






35 










40 








45 








Asp Asn 


Lys 


He 


Thr 


Lys 


Ser 


Arg Arg 


Cys 


Lys 


Arg 


He 


Lys 


Leu 


Cys 




50 










55 








60 










Lys 


Lys 


Asp 


Leu 


He 


Asp 


He 


Gly Ala 


He 


Lys 


Lys 


Pro 


He 


Asn 


Val 


65 










70 








75 










80 



Ala lie Phe 



He Arg 
Tyr Val 

Leu Pro 

130 
Lys Glu 
145 



Glu 

Asn 
115 
Glu 

Leu 



Gly A s p Glu 



He Val He 



Ala He Met 



Gly Ser Thr Gly 
85 

Cys Asn Lys lie 
100 

Lys Ser Val Asn 

Tyr Leu Cys He 
135 

Val Lys Asn He 
150 

G ly M o t Lys Glu 



- '14 i 

Ser He 

Glu Asn 
105 
Glu Leu 
120 

His Asp 



Gly Thr Asn 
90 

Val Phe Asn 
Tyr Glu Gin 



Ala Leu 

Val Lys 
110 
Ala Arg 
125 

Tyr Glu 



Lys Ser Val 
140 

Lys Asp Tyr Lys Pro 
155 

IlQ Cys S e r S e r Asn S e rll e 



He He 



Asn He 
95 

Ala Leu 

Glu Phe 

Glu Leu 

Leu Cys 
160 
-A sp Lys 



V. 



Val Ser Ala 
la Lys He 

Leu Asp Asn 
Ser Lys He 
Pro Phe Gin 



Gly He Asp Ser 
Asn Asn Lys He 
Gly Phe Phe Leu 
He Pro Val Asp 

Asn Lys Val Leu 
Asn Asn He Asn 
Asn Leu Thr iMet 



Phe Gin 
Val Ala 



Gly Leu Tyr 
Leu Ala Asn 



Lys Lys Leu Leu Asn 
Ser Glu His Ser Ala 



Asn Ala Leu Lys His Pro Lys 
Thr Met Met Asn 



Asp 
Phe 
Glu 
er 
hr 
Gin 
Cys 
Thr 
Asn 
Glu 
Lys 
He 



Ser Ala 
Leu Phe 
Cys He 
Gin Met 
Trp Pro 
Val Ser 
He Lys 
Val Leu 
Lys He 
Ser Phe 
Gin He 
Tyr Asn 



Asp Val 
He His 
Tyr Tyr 
Asp Arg 
Thr Leu 
Leu Ala 
Asn Ala 
Lys Tyr 
Asn Ser 
Leu Gin 
Lys His 



Asp Tyr 
Ser Cys 
Pro Asp 
He Lys 
Thr Phe 
Tyr Gin 
Ser Asn 
Phe Asp 
Gin Lys 
He His 
Asn Ser 



Lys Thr Lys 
Lys He Phe 
Asp Glu Leu 
Trp Lys Met 
Lys Gly Leu 
Asn Asp He 
Val Glu Phe 
Met Gin He 
Thr Asn Leu 
His Lys Pro 
Ala Gly He 
Glu He Ala 
He Ser Ser 
Val Ser Glu 
Ser Trp Ala 
Ser 



Cys Leu 
Leu Cys 
Lys Asn 
Gly Lys 
Glu Val 
Glu Val 
He Asp 
Pro He 
Lys Pro 
Ser Leu 
Lys Gly 
Asn Asn 
He He 
Asn Ser 
Lys Asp 



Ser Thr 
Lys Glu 
He His 
He Phe 
Gin Asp 
Ser Ser 
Val Thr 
Lys He 
He Glu 
He Val 
Lys Ser 
Leu Tyr 
Leu Asp 
Glu His 
Asn Phe 
Leu Phe 
Ser Gin 
Glu Asp 
Lys Ala 



Met Tyr 
Ser He 
Lys Asn 
Gin Cys 
Asn Phe 
Gly Gly 
Ser Glu 
Thr rie 
Thr His 
His Lys 
Val He 
Ser Leu 
Leu Ala 
Phe Pro 
Tyr Pro 
Leu Asn 
Val Leu 
Leu Met 
Thr Asp 



(3) ANGABEN ZU SEQUENZ ID NR: 3 

Plasmodium Falciparum l-Desoxy-D-Xylulose-5- 

phosphat synthase (dxs) gen 

(iii) SEQUENZKENNZEICHEN: 

(A) LANGE: 3872 BASENPAARE 

(B) ART: Nukleotidsequenz 

(C) STAMM: HB3 




(iv) ART DES MOLEKOLS: DNA 

(v) URSPRONGLICHE HERKUNFT: 

(A) ORGANISMUS: Plasmodium falciparum 
(ix) MERKMAL 
(A) NAME/SCHLOSSEL: mRNA 
GEN=dxs 

PRODUKT=l-Desoxy-D-xyiulose- 5 -phosphat synthase 
(ix) MERKMAL 

(A) NAME/SCHLOSSEL; Gen 

(B) LAGE:L..3872 
GEN=dxs 

(ix) MERKMAL 
(A) NAME/SCHLOSSEL: CDS 
GEN=dxs 

FUNKTION: bei der Isopentenyldiphosphatbiosynthese betei- 
ligt 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 3 

Igtaatatac GTATAATATA TATATAATAT ATTCTTACGT ATGTATCATT TATGAATCAT 60 

AATAATATTC TAAATTTACC TTCCGTTTTT GCTCGATCTT CTCATTTTCG TTTCAGCTTT 120 

TATCA ATG ATT TTT AAT TAT GTG TTT TTT AAG AAC TTT GTA CCA GTT GTT 170 
Met He Phe Asn Tyr Val Phe Phe Lys Asn Phe Val Pro Val Val 







1 








5 








10 








15 




CTA 


TAG 


ATT 


CTC 


GTT 


ATA 


ATA 


TAT 


ATT 


AAC 


TTA 


AAT 


GGC 


ATG 


AAT 


AAT 


218 


Leu 


Tyr 


He 


Leu 


Leu 
20 


He 


He 


Tyr 


He 


Asn 
25 


Leu 


Asn 


Gly 


Met 


Asn 
30 


Asn 




AAA 


AAT 


CAA 


ATA 


AAA 


ACA 


GAA 


AAA 


ATT 


TAT 


ATA 


AAG 


AAA 


TTG 


AAT 


AGG 


266 


Lys 


Asn 


Gin 


He 
35 


Lys 


Thr 


Glu 


Lys 


He 
40 


Tyr 


He 


Lys 


Lys 


Leu 
45 


Asn 


Arg 




TTG 


TCA 


AGG 


AAA 


AAT 


TCG 


TTA 


TGT 


AGT 


TCT 


AAA 


AAT 


AAA 


ATA 


GCA 


TGC 


314 


Leu 


Ser 


Arg 
50 


Lys 


Asn 


Ser 


Leu 


Cys 
55 


Ser 


Ser 


Lys 


Asn 


Lys 
60 


He 


Ala 


Cys 




TTG 


TTC 


GAT 


ATA 


GGA 


AAT 


GAT 


GAT 


AAT 


AGA 


AAT 


ACG 


ACA 


TAT 


GGC 


TAT 


362 


Leu 


Phe 
65 


Asp 


He 


Gly 


Asn 


Asp 
70 


Asp 


Asn 


Arg 


Asn 


Thr 
75 


Thr 


Tyr 


Gly 


Tyr 





1 



















• 0 




• 


• • 




• • 


• • 


• 


• • 




















» • 


• 


• • • • — 


• 




• 


• • 


















- 3L6 


m 


• 
• 


• • 

• • 








• 


* » • • 










1 








• 


• 


• • 


• 










• * • 


ZXAT 


GTG 

W X W 


AAT 


GTT 

W X X 


AAA 


AAT 


GAT 


GAT 


ATT 


AAT 


TCC 


TTA 
X X n 


PTA 
\^ X n 


AAA 


AAT 


AAT 


410 




vox 


A ^ n 


vox 


xj y o 


Asn 
no li 


Asp 


Asp 


lie 


Asn 


Ser 


T Ai 1 
Xjcr U. 


Toil 
XjCT LI 


Lvs 


Asn 


Asn 




an 

O V 




















90 










95 




TAT 


AGT 


AAT 


AAA 


TTG 

X X VJ 


TAP 

X n.Vi# 


ATG 


GAT 


AAG 


AGG 


AAA 


AAT 
nn X 


ATT 
n X X 


AAT 


AAT 


GTA 


458 


Tvr 


o ^ ^ 


A ^ n 






Tvr 


Met 


Asp 


Lys 


Ara 


Lvs 


G n 
Ao 11 


T 1 ca 
X Xc 


Asn 


Asn 


Val 












1 00 

XKJyJ 










105 










110 






ATT 


AGT 


ACT 


AAT 
nnx 


AAA 
nnn 


ATA 


TCT 

X Vi^ X 


GGG 


TCC 


ATT 


TCA 


AAT 
nnx 


ATT 
nx X 


TGT 


AGT 


AGA 


506 




OCX 


Th r 

X ilX 


A < n 
no 11 


Xi y o 


X -U c 


O ^ X 


Glv 

vjxy 


Ser 


lie 


Ser 


2V Q n 
Aoll 


T 1 o 
X Xc 


Cys 


Ser 


Ara 










IIS 

X X <^ 










120 










125 








AAT 


PAA 


AAA 


GA A 
v7nn 


AAT 
nn X 


GAA 


CAA 


AAA 


AGA 


AAT 


AAA 


CAA 


AGA 


TGT 


TTA 


ACT 


554 


Asn 


Gin 


Lys 


Glu 


Asn 


Glu 


Gin 


Lys 


Arg 


Asn 


Lys 


Gl n 


Ary 


Cys 


Leu 


Thr 








X O w 










135 










X *s U 










PAA 


TGT 

X O X 


PAP 


APT 


TAT 
xn X 


AAT 
nf \ X 


ATG 


TCA 


CAT 


GAA 


CAG 


GAP 


AAA 
nnn 


CTA 


GCT 


AAT 


602 


Gin 


v.* o 


His 

n X o 


Thr 

X IIX 


xyx 


Asn 

«^0 11 


Met 


Ser 


His 


Glu 


Gin 


ASp 


xjy o 


Leu 


Ala 


Asn 






X *i >^ 










150 

X -^J v/ 










X ^ 












GAT 


AAT 
Anx 


AAT 
nnx 


AGG 


AAT 
nn X 


AAT 


AAA 


AAG 


AAT 


TTT 


AAT 


TTA 
X Xn 


TTA 
X Xn 


TTT 


ATA 


AAT 


650 






A en 
noil 


Arg 


A Q n 
noil 


A sn 
noil 


TiVS 

xjy o 


Lys 


Asn 


Phe 


Asn 


T A1 1 

XiCU 


J .CX1 1 

XJCf Li 


Phe 


lie 


Asn 




1 fin 








X VJ 










170 










175 




^T AT 

AX 


TTT 

XXX 


AAT 


TTG 

X X w 


AAA 
nnn 


PGA 


ATG 


AAA 


AAT 


TCT 


CTT 


PTA 


AAT 
nnX 


AAA 


GAC 


AAT 


698 




IT lie 


A crt 
noil 


Xjs3 U 


T.v Q 
Xj o 


A T"rf 


Met 


Lys 


Asn 


Ser 


Leu 


Leu 


Asn 


Lvs 


ASD 


Asn 










1 ftO 

1.0\J 










185 










190 






TTP 


TTT 

XXX 


TAP 


TGT 


AAA 


GAA 


AAA 


AAA 


TTG 


TCA 


TTT 


PTG 

X w 


PAT 
v^n X 


AAG 


GCC 


TAT 


746 






Tv/ r* 


P V <5 

y o 


Xj y o 


Glu 


Lys 


Lys 


Leu 


Ser 


Phe 


Tail 
IjC LI 


nx o 


Lvs 


Ala 


Tvr 










X -7 J 










200 










205 








AAA 


AAA 


AAA 


AAT 


TGC 


ACT 


TTT 


CAA 


AAT 


TAT 


AGT 


TTA 
1. X n 


AAA 


AGA 


AAA 


TCT 


794 


T.v/ ^ 
y o 


T.v/*? 
j-j y o 


xj y o 


As n 


Cys 


Thr 


Phe 


Gin 


Asn 


Tvr 


Ser 


Leu 


Xjy o 


Ara 


Lys 


Ser 








^ X u 










215 










^ ^ VJ 










AAT 


PGT 


GAT 
on X 


TP A 


PAT 
\-»n 1 


AAA 


TTG 


TTT 


TCT 


GGA 


GAA 


TTT 

1 X X 


GAC 


GAT 


TAT 


ACA 


842 


A Q n 




n^o 


•J C X 


His 


Lys 


Leu 


Phe 


3e r 


Glv 


Glu 


IT I Itr 


no^ 


Asp 


Tyr 


Thr 






9 ^ 
^ ^ ^ 










230 










^ ^ >j 












AAT 


AAT 
nr\ X 


AAT 
nn X 


GPT 


TTA 
X X n 


TAT 

X C\ X 


GAA 


TCC 


GAA 


AAA 


AAA 


GAA 
Vjnn 


TAP 
X nv^ 


ATT 


ACA 


CTA 


890 


c n 




noil 


A 1 A 
nX d 


Toil 

Jj" Li. 


Tw T" 

X yx 


Glu 


Ser 


Glu 


Lvs 

xiy J 


Lys 


Gl n 

VJ X Ll 


X yr 


lie 


Thr 


Leu 




^ *i U 










945 










250 










255 




AAT 


AAT 


AAT 
nnX 


AAT 
nn X 


AAA 


AAT 


AAT 


AAT 


AAT 


AAA 


AAT 


AAT 
nnX 


GAT 
onx 


AAT 


AAA 


AAT 


938 


A «r» 


A e 


Zi Q n 
Aoll 


21 Q n 
Aoil 


Xjy o 


A ^n- 
noil 


Asn 

<^0 11 


Asn 


Asn 


Lys 


Asn 


Asn 


Ao^ 


Asn 


Lvs 


Asn 












9 ^;o 










265 










270 






AAT 


GAT 


AAT 
nAX 


AAT 
nn X 


GAT 
On X 


TAT 

X c\ X 


AAT 


AAT 


AAT 


AAT 


AGT 


TGT 

X w X 


AAT 


AAT 


TTA 


GGA 


986 


lb «; n 


Asp 


A 

noil 


A ^ n 
no 11 




Tvr 
xyx 


Asn 


Asn 


Asn 


Asn 


Ser 


v^y o 


<3 n 
Aoll 


Asn 


Leu 


Gly 








^ 1 D 










280 
^ \j \j 










285 








Phag 


AGA 


TPP 


AAT 
AAX 


PAT 
wnx 


TAT 
xnx 


GAT 

wX^X 


AAT 


TAT 


GGT 


GGA 


GAT 


AAT 


AAT 


AAT 


CCA 


1034 


Gl 11 


A TTS 

r\x ^ 


OCX 


A Qn 
noil 


His 

i 1 ^ o 


xyx 


Asp 


Asn 


Tvr 

X y J. 


Glv 


Gly 


A Qn 
no^ 


A Qn 
noil 


Asn 


Asn 


Pro 








9Ckn 










295 

tm ^ 'J 




















TGT 

1 V3X 


AAT 


AAT 
AAX 


AAT 
AAX 


AAT 
nnx 


GAP 


AAA 


TAT 


GAT 


ATA 


GGA 


AAA 


TAT 


TTC 


AAA 


CAG 


1082 


Cys 


A 


noi 1 


noi 1 


Asn 
no 11 


Asp 


Lys 


Tvr 

xyx 


Asp 


lie 


Glv 


Xjy o 


T VT* 

lyr 


Phe 


Lys 


Gin 














110 










•J X ^ 












ATT 


AAT 
Aril 


APP 


111 


ATT 
AX X 


AAT 
nnx 


ATT 

n, X X 


GAT 


GAA 


TAT 


AAA 


APT 
n\^ X 


ATA 
nX n 


TAT 


GGT 


GAT 


1130 




Asn 


Th V- 
1 ilx 


irn.6 


X x^ 


A ctn 
noil 


Tie 

X X c 


Aso 


Glu 


Tvr 

xyx 


Lys 


Th r 
X iiX 


Tie 
X xc 


Tvr 


Gly 


Asp 














'^9S 










330 










335 




nA A 


ATA 
AX A 


TAT 
X AX 


AAA 
Ann 


GAA 
unn 


ATA 
nxn 


TAT 


GAA 


CTA 


TAT 


GTA 


GAA 
vsnn 


AGA 


AAT 


ATT 


CCT 


1178 




T 1 o 


Tyr 


Lys 


Gl 11 
wX U 


Tie 

X xc 


Tvr 
xyx 


Glu 


Leu 


Tvr 

xyx 


Val 


Gl 11 

ox Li 


A T*rT 
nx y 


Asn 


He 


Pro 


















345 










350 




1226 




TAT 
i. Ax 


TUT 
1 Ax 


nA A 
uAA 


PGA 


AAA 
nnn 


TAT 
xnx 


TTT 

XXX 


TCA 


GAA 


GAT 


ATT 
nx X 


AAA 


AAG 


AGT 


GTC 


Gl 11 


Tyr 


Tyr 


Gl 11 
VJX LI 


A r*rf 


TjVS 
xjy o 


Tvr 

xyx 


Phe 


Ser 


Glu 


ASD 


T 1 o 
X X6 


Xjy o 


Lys 


Ser 


Val 
















360 










365 






1274 




TTT 


uAX 


ATA 
AX A 


GAT 


AAA 
nnn 


TAT 
xnx 


AAT 


GAT 


GTC 


GAA 


TTT 

XXX 


GAA 


AAA 


GCT 


ATA 






A 

no£J 


T 1 A 
X xc 


Asn 
n.o^ 


TjVS 

xjy o 


Tvr 

xyx 


Asn 


ASD 


Val 


Glu 




Glu 


Lys 


Ala 


He 


















375 










380 











if : 



AAA 


GAA 


GAA 


TTT 


ATA 


AAT 


AAT 


Lys 


Glu 


Glu 


Phe 


rie 


Asn 


Asn 




385 










390 


ACA 


TAT 


TAT 


AAA 


AAA 


GAA 


AAT 


Thr 


Tyr 


Tyr 


Lys 


Lys 


Glu 


Asn 


400 










405 




TAT 


TTC 


CCA 


TTA 


TTA 


AAA 


TTA 


rn 

Tyr 


f ne 


fro 


* 

lieu 


- 

Lteu 


Liys 


Leu 










420 






TTA 


AAA 


AAA 


CAA 


TAT 


TTA 


CCT 


Leu 


Lys 


Lys 


Gin 


Tyr 


Leu 


Pro 






























TTA 


TTT 


TTT 


ATT 


GTA 


AAT 


ATA 


Leu 


Phe 


Phe 


He 


Val 


Asn 


He 






450 










AGC 


TCT 


TTA 


GAA 


ATT 


CAA 


TTA 


Ser 


Ser 


Leu 


Glu 


He 


Gin 


Leu 




465 










470 


^AT 


GAT 


AAT 


GTT 


ATA 


TAT 


GAT 


Ifyr 


Asp 


Asn 


Val 


He 


Tyr 


Asp 


piso 








485 




ATA 


TTG 


ACC 


GGA 


AGA 


AAA 


CTA 


He 


Leu 


Thr 


Gly 


Arg 


Lys 


Leu 










500 






GGT 


ATT 


AGT 


GGA 


TTC 


GTA 


AAT 


Giy 


lie 


3er 


Gly 


Phe 


Leu 


Asn 








5L5 








GGG 


GCT 


GGT 


CAC 


AGT 


TCC 


ACT 


Gly 


Ala 


Gly 


His 


Ser 


Ser 


Thr 






530 










GAA 


GCC 


GAG 


TGG 


CAA 


GTG 


AAG 


Glu 


Ala 


Glu 


Trp 


Gin 


Val 


Lys 




545 










550 


ATA 


GAA 


ATA 


AGT 


GAT 


AAC 


GCA 


He 


Glu 


He 


Ser 


Asp 


Asn 


Ala 


560 










565 




CAA 


AAA 


GGA 


ATA 


CAC 


AAT 


GAT 




Lys 


Gly 


He 


His 


Asn 


Asp 


1 








580 








AAT 


TAT 


ATC 


AAT 


CCT 


TCA 


Asn 


Asn 


Tyr 


He 


Asn 


Pro 


Ser 








595 








GTA 


CCA 


AAT 


GTA 


CGA 


AAT 


GAT 


Val 


Pro 


Asn 


Val 


Arg 


Asn 


Asp 






610 










GCT 


ATT 


ATA 


GGA 


GAT 


GGT 


GGT 


Ala 


He 


He 


Gly 


Asp 


Gly 


Gly 




625 










630 


TTA 


AAT 


TAT 


ATT 


TCA 


TTC 


TTG 


Leu 


Asn 


Tyr 


He 


Ser 


Phe 


Leu 


640 










645 




GAT 


AAC 


GGA 


CAA 


GTT 


TCT 


TTA 


Asp 


Asn 


Gly 


Gin 


Val 


Ser 


Leu 










660 






AAT 


AGA 


CCT 


ATA 


GGT 


TCT 


ATA 


Asn 


Arg 


Pro 


He 


Gly 


Ser 


He 



GGA 
Gly 

ATT 
He 

ATT 
He 

TTA 
Leu 



GTT 
Val 

TTA 
Leu 

AAT 
Asn 

TTA 
Leu 



TAT 
Tyr 

ATA 
He 

AAT 
Asn 
425 
GCA 
Ala 



ATT 
lie 

ATG 
Met 
410 
CCA 
Pro 

CAT 
His 



AAT 
Asn 
395 
AAA 
Lys 

TCA 
Ser 

GAA 
Glu 



GAT 
Asp 

TTA 
Leu 



ACA 
Thr 
455 
TTA 
Leu 

ATA 

He 

TTA 
Leu 

ATT 
lie 

TCA 
Ser 
535 
AAT 
Asn 

AAT 
Asn 

AAT 
Asn 

GAT 

Asp 

AAC 
Asn 
615 
TTA 
Leu 

AAT 
Asn 

CCA 
Pro 

TCA 
Ser 



675 



GGA 
Gly 

TTA 
Leu 

GGA 
Gly 

TTT 
Phe 

TTT 
Phe 
520 
TTA 
Leu 

AAA 
Lys 

GTC 
Val 

AAT 
Asn 

GTG 
Val 
600 
CAT 
His 

ACA 
Thr 

TCT 
Ser 

ACA 
Thr 

GAT 
Asp 
680 



GGT 
Gly 

TTG 
Leu 

CAT 
His 

CTA 
Leu 
505 
GAA 
Glu 

AGT 
Ser 

GAA 
Glu 

ACG 
Thr 

ATT 
He 
585 
GTA 
Val 

AAC 
Asn 

GGT 
Gly 

AAA 
Lys 

AAT 
Asn 
665 
CAT 
His 



CAT 
His 

TAT 
Tyr 

CAA 
Gin 

490 
TCA 
Ser 

AGT 
Ser 

GCT 
Ala 

AAA 
Lys 

AAT 
Asn 
570 
AAC 
Asn 

GGA 
Gly 

GTG 
Val 

GGA 
Gly 

ATT 
He 
650 
GCC 
Ala 

TTA 
Leu 



TTT 
Phe 

ATT 
He 
475 
GCA 
Ala 

TTA 
Leu 

ATT 
lie 

ATA 
He 

TAT 
Tyr 
555 
AAT 
Asn 

AAT 
Asn 

AGA 
Arg 

GAT 
Asp 

ATG 
Met 
635 
TTA 
Leu 

GTA 
Val 

CAT 
His 



TCC 
Ser 
460 
TTT 
Phe 

TAT 
Tyr 

AGA 
Arg 

TAT 
Tyr 

CAA 
Gin 
540 
GGA 
Gly 



GAA 

Glu 

AAA 
Lys 
620 
GCA 
Ala 



♦ • 


• • 


• 


• • • 




• 


• 


• • • 




• 


• 


• » « • • • 








* • 




• • 




• • • • 


ATA 


GAT 


AAT 


1322 


He 


Asp 


Asn 




ATA 


TTA 


CAT 


1370 


He 


Leu 


His 








415 




TTA 


AAA 


AAG 


1418 


Leu 


Lvs 


Lvs 






430 






AAA 


ATA 


TTT 


1466 


Lys 


He 


Phe 




44S 








TCT 


GTT 


TTA 


1514 


Ser 


Val 


Leu 




AAT 


CAA 


CCA 


1562 


Asn 


Gin 


Pro 




GTA 


CAT 


AAG 


1610 


Val 


His 


Lys 








495 




AAT 


AAA 


AAA 


1658 


Asn 


Lys 


~Lys 






510 






GAT 


AAA 


TTT 


1706 


Asp 


Lys 


Phe 




525 








GGA 


TAT 


TAT 


1754 


Gly 


Tyr 


Tyr 




AAT 


GGA 


GAT 


1802 


Asn 


Gly 


Asp 




AGG 


ATA 


TTT 


1850 


Arg 


He 


Phe 








575 




ATT 


AAT 


AAT 


1898 


He 


Asn 


Asn 






590 






AAT 


ACG 


AAT 


1946 


Asn 


Thr 


Asn 




605 








GTA 


CAC 


ATT 


1994 


Val 


His 


He 




TTA 


GAA 


GCG 


2042 


Leu 


Glu 


Ala 




ATT 


TAT 


AAT 


2090 


He 


Tvr 


Asn 








655 




ATA 


TCA 


GGT 


2138 


He 


Ser 


Glv 






670 






TTT 


GTT 


TCT 


2186 


Phe 


Val 


Ser 













'i 



AAT 


ATA 


GAA 


GCA 


AAT 


GCT 


GGT 


GAT 


AAT 


AAA 


TTA 


TCG 


AAA 


AAT 


GCA 


7\ 7\ 7\ 

AAA 




Asn 


He 


Glu 
690 


Ala 


Asn 


Ala 


Gly 


Asp 
695 


Asn 


Lys 


Leu 


Ser 


Lys 
700 


Asn 


Ala 


Lys 




GAG 


AAT 


AAC 


ATT 


TTT 


GAA 


AAT 


TTG 


AAT 


TAT 


GAT 


TAT 


ATT 


GGT 


GTT 


GTCj 


o O Q O 


Giu 


Asn 
705 


Asn 


He 


Phe 


Glu 


Asn 
710 


Leu 


Asn 


Tyr 


Asp 


Tyr 

TIC 

715 


lie 


Gly 


Val 


vai 




AAT 


GOT 


AAT 


AAT 


ACA 


GAA 


GAG 


CTC 


TTT 


AAA 


GTA 


TTA 


AAT 


AAT 


ATA 


1i 71 a 

AAA 




Asn 


Glv 

A J 


Asn 


Asn 


Thr 


Glu 


Glu 


Leu 


Phe 


Lys 


Val 


Leu 


Asn 


Asn 


He 


Lys 




720 








725 










730 










735 




GAA 


AAT 


AAA 


TTA 


AAA 


AGA 


GCT 


ACT 


GTT 


CTT 


CAT 


GTA 


CGT 


ACA 


AAA 


TV A T\ 

AAA 


O "J T Q 

2 J /o 


Glu 


Asn 


Lys 


Leu 


Lys 


Arg 


Ala 


Thr 


Val 


Leu 


His 


Val 


Arg 


Thr 


Lys 


Lys 




















745 










750 








































TCG 


AAT 


GAT 


TTT 


ATA 


AAT 


TCA 


AAG 


AGT 


CCA 


ATA 


AGT 


ATA 


TTG 


CAC 


TCT 


242o 


Ser 


Asn 


Asp 


Phe 


He 


Asn 


Ser 


Lys 


Ser 


Pro 


He 


Ser 


He 


Leu 


His 


Ser 








755 










760 










765 








ATA 


AAG 


AAA 


AAT 


GAG 


ATT 


TTC 


CCT 


TTC 


GAT 


ACC 


ACT 


ATA 


TTA 


AAT 


GGA 


24 /4 


He 


Lys 


Lys 


Asn 


Glu 


He 


Phe 


Pro 


Phe 


Asp 


Thr 


Thr 


He 


Leu 


Asn 


Gly 






770 










775 










780 












ATT 


CAT 


AAG 


GAG 


AAC 


AAG 


ATA 


GAA 


GAA 


GAG 


AAA 


AAT 


GTG 


TCT 


TCA 


2322 


^sn 


He 


His 


Lys 


Glu 


Asn 


Lys 


He 


Glu 


Glu 


Glu 


Lys 


Asn 


Val 


Ser 


Ser 






785 








790 










795 












TCT 


ACA 


AAG 


TAT 


GAT 


GTA 


AAT 


AAT 


AAG 


AAT 


AAT 


AAA 


AAT 


AAT 


GAT 


AAT 


2 D / U 


Ser 


Thr 


Lys 


Tyr 


Asp 


Val 


Asn 


Asn 


Lys 


Asn 


Asn 


Lys 


Asn 


Asn 


Asp 


Asn 




800 








805 










810 










815 




AGT 


GAA 


ATT 


ATA 


AAA 


TAT 


GAA 


GAT 


ATG 


TTT 


TCA 


AAA 


GAG 


ACG 


TTC 


ACA 


O ^ 1 Q 

2 o lb 


3er 


Glu 


He 


rie 


Lys 
820 


Tyr 


Glu 


Asp 


Met 


Phe 
825 


Ser 


Lys 


Glu 


Thr 


Phe 
8 30 


Thr 




GAT 


ATA 


TAT 


ACA 


AAT 


GAA 


ATG 


TTA 


AAA 


TAT 


TTA 


AAG 


AAA 


GAT 


AGA 


AAT 


2 boo 


Asp 


lie 


Tyr 


Thr 


Asn 


Glu 


Met 


Leu 


Lys 


Tyr 


Leu 


Lys 


Lys 


Asp 


Arg 


Asn 






835 










840 










845 








ATA 


ATA 


TTC 


CTA 


TCT 


CCC 


GCT 


ATG 


TTA 


GGA 


GGA 


TCA 


GGA 


TTG 


GTT 


AAA 


2/14 


lie 


He 


Phe 
850 


Leu 


Ser 


Pro 


Ala 


Met 
855 


Leu 


Gly 


Gly 


Ser 


Gly 
860 


Leu 


Val 


Lys 




ATT 


AGT 


GAG 


CGT 


TAT 


CCA 


AAT 


AAT 


GTA 


TAT 


GAT 


GTA 


GGT 


ATA 


GCA 


GAA 


27 62 


He 


Ser 
865 


Glu 


Arg 


Tyr 


Pro 


Asn 
870 


Asn 


Val 


Tyr 


Asp 


Val 
875 


Gly 


He 


Ala 


Glu 




CAA 


CAT 


TCT 


GTA 


ACT 


TTC 


GCA 


GCA 


GCT 


ATG 


GCA 


ATG 


AAT 


AAG 


AAA 


TTA 


2810 


■so 


His 


Ser 


Val 


Thr 


Phe 
885 


Ala 


Ala 


Ala 


Met 


Ala 
890 


Met 


Asn 


Lys 


Lys 


Leu 

one 

895 






ATA 


CAA 


TTA 


TGT 


ATA 


TAT 


TCG 


ACC 


TTT 


TTA 


CAA 


AGA 


GCA 


TAT 


GAT 


o o c o 


Lys 


He 


Gin 


Leu 


Cys 


He 


Tyr 


Ser 


Thr 


Phe 


Leu 


Gin 


Arg 


Ala 


Tyr 


Asp 










900 










905 










910 






CAA 


ATT 


ATA 


CAT 


GAT 


CTT 


AAT 


TTA 


CAA 


AAT 


ATA 


CCT 


TTA 


AAG 


GTT 


ATA 


2900 


Gin 


He 


He 


His 
915 


Asp 


Leu 


Asn 


Leu 


Gin 
920 


Asn 


He 


Pro 


Leu 


Lys 
925 


Val 


He 




ATT 


GGA 


AGA 


AGT 


GGA 


TTA 


GTA 


GGA 


GAG 


GAT 


GGG 


GCA 


ACA 


CAT 


CAA 


GGT 




He 


Gly 


Arg 
930 


Ser 


Gly 


Leu 


Val 


Gly 
935 


Glu 


Asp 


Gly 


Ala 


Thr 
940 


His 


Gin 


Gly 




ATA 


TAT 


GAT 


TTA 


TCT 


TAT 


CTT 


GGG 


ACA 


CTT 


AAC 


AAT 


GCA 


TAT 


ATA 


ATA 


o 

3002 


He 


Tyr 
945 


Asp 


Leu 


Ser 


Tyr 


Leu 
950 


Gly 


Thr 


Leu 


Asn 


Asn 
955 


Ala 


Tyr 


He 


He 




TCT 


CCA 


AGT 


AAT 


CAA 


GTT 


GAT 


TTG 


AAA 


AGA 


GCT 


CTT 


AGG 


TTT 


GCT 


TAT 


•3 rt C 

3050 


Ser 


Pro 


Ser 


Asn 


Gin 


Val 


Asp 


Leu 


Lys 


Arg 


Ala 


Leu 


Arg 


Phe 


Ala 


Tyr 




960 










965 










970 










975 




TTA 


GAT 


AAG 


GAC 


CAT 


TCT 


GTG 


TAT 


ATA 


CGT 


ATA 


CCC 


AGA 


ATG 


AAC 


ATA 


3098 


Leu 


Asp 


Lys 


Asp 


His 


Ser 


Val 


Tyr 


He 


Arg 


He 


Pro 


Arg 


Met 


Asn 


He 








980 










985 










990 







49 - 



TTA AGT GAT AAG TAG ATG AAA GGA TAT TTG AAC ATT CAT ATG AAA AAT 3146 
Leu Ser Asp Lys Tyr Met Lys Gly Tyr Leu Asn lie His Met Lys Asn 

995 1000 1005 

GAG AGO AAA AAT ATG GAT GTA AAC GTG GAT ATA AAC GAT GAT GTA GAT 3194 
Glu Ser Lys Asn lie Asp Val Asn Val Asp lie Asn Asp Asp Val Asp 

1010 1015 1020 

AAA TAT AGT GAA GAA TAT ATG GAC GAT GAT AAT TTT ATA AAA TCG TTT 3242 
Lys Tyr Ser Glu Glu Tyr Met Asp Asp Asp Asn Phe lie Lys Ser Phe 

1025 1030 1035 
ATT GGA AAA TCT AGA ATT ATT AAA ATG GAT AAT GAA AAT AAT AAT ACA 3290 
lie Gly Lys Ser Arg lie lie Lys Met Asp Asn Glu Asn Asn Asn Thr 
^fr4 0 " - 10^45 - 10 50 - 1 055 




AAT GAA CAT TAT TCA AGC AGA GGA GAT ACA CAG ACA AAA AAA AAA AAA 3338 
Asn Glu His Tyr Ser Ser Arg Gly Asp Thr Gin Thr Lys Lys Lys Lys 

1060 1065 1070 

GTT TGT ATC TTT AAC ATG GGT AGT ATG CTT TTT AAT GTA ATT AAT GCT 338 6 
Val Cys lie Phe Asn Met Gly Ser Met Leu Phe Asn Val lie Asn Ala 

1075 1080 1085 

ATA AAA GAA ATT GAA AAA GAA CAA TAT ATT TCA CAT AAT TAT TCT TTT 3434 
le Lys Glu lie Glu Lys Glu Gin Tyr lie Ser His Asn Tyr Ser Phe 
1090 1095 1100 

TCA ATT GTT GAT ATG ATA TTT TTA AAT CCT TTA GAT AAA AAT ATG ATA 34 82 
Ser lie Val Asp Met lie Phe Leu Asn Pro Leu Asp Lys Asn Met lie 

1105 1110 1115 

GAT CAT GTA ATA AAA CAA AAT AAA CAT CAA TAT TTA ATT ACT TAT GAA 3 530 
Asp His Vai lie Lys Gin Asn Lys His Gin Tyr Leu lie Thr Tyr Glu 
1120 1125 1130 1135 

GAT AAT ACT ATA GGT GGT TTT TCT ACA CAT TTC AAT AAT TAT TTA ATA 3 57 8 
Asp Asn Thr lie Gly Gly Phe Ser Thr His Phe Asn Asn Tyr Leu lie 

1140 1145 1150 

GAA AAT AAT TAT ATT ACA AAA CAT AAC TTA TAT GTT CAT AAT ATT TAT 362 6 
Glu Asn Asn Tyr lie Thr Lys His Asn Leu Tyr Val His Asn lie Tyr 

1155 1160 1165 

TTA TCT AAT GAG CCA ATT GAA CAT GCA TCT TTT AAG GAT CAA CAA GAA 3674 
Leu Ser Asn Glu Pro lie Glu His Ala Ser Phe Lys Asp Gin Gin Glu 

1170 1175 1180 

GTC GTC AAA ATG GAT AAA TGT AGT CTT GTC AAT AGA ATT AAA AAT TAT 3722 
al Val Lys Met Asp Lys Cys Ser Leu Val Asn Arg lie Lys Asn Tyr 

1185 1190 1195 

TT AAA AAT AAT CCT ACA TGA TGTAAGATAA ATATATATTT CTAAAATTAT 3773 
Leu Lys Asn Asn Pro Thr 
1200 1205 



TTTTTTTTTA TACTTTAATG TGTACAATAA AATATATATC TAAATATATT TTATTTGTAC38 33 
GCTTTTTTTT XTTTTTTTTT AATTGTTATT TTTGTATAT 3872 



(4) ANGABEN ZU SEQUENZ ID NR: 4 

( i ) Sequenz kennzeichen : 

(A) LANGE: 1205 Aminosauren 

(B) ART: Aminosaure 

(ii) Art des Molekais: PROTEIN 

(xi) Sequenzbeschreibung: SEQ ID NO 4: 



# 



• • • 



• • • 



• • • 

• • • • I 



Met 



He Phe Asn Tyr Vai ?he Phe Lys Asn Phe Val Pro Val Val Leu 



Tyr He Leu Leu He He Tyr He Asn Leu Asn Gly Met Asn Asn Lys 
Asn Gin He Lys Thr Glu Lys He Tyr He Lys Lys Leu Asn Arg Leu 
Ser Arg Ty ^^^r t.p.u Cys Ser S- e r Lvs A sn Lys He Ala Cys Leu 



Phe Asp He Gly Asn Asp Asp Asn Arg Asn Thr Thr Tyr Gly Tyr Asn 



Val Asn Val Lys Asn Asp Asp He Asn Ser Leu Leu Lys Asn Asn Tyr 
er Asn Lys Leu Tyr Met Asp Lys Arg Lys Asn He Asn Asn Val He 

Ser Thr Asn Lys He Ser Gly Ser He Ser Asn He Cys Ser Arg Asn 
Gin Lys Glu Asn Glu Gin Lys Arg Asn Lys Gin Arg Cys Leu Thr Gin 




Cys His Thr Tyr Asn Met Ser His Glu Gin Asp Lys Leu Ala Asn Asp 
Asn Asn Arg Asn Asn Lys Lys Asn Phe Asn Leu Leu Phe He Asn Tyr 
Phe Asn Leu Lys Arg Met Lys Asn Ser Leu Leu Asn Lys Asp Asn Phe 



Phe Tyr Cys Lys Glu Lys Lys Leu Ser Phe Leu His Lys Ala Tyr Lys 
Lys Lys Asn Cys Thr Phe Gin Asn Tyr Ser Leu Lys Arg Lys Ser Asn 



Arg Asp Ser His Lys Leu Phe Ser Gly Glu Phe Asp Asp Tyr Thr Asn 
Asn Asn Ala Leu Tyr Glu Ser Glu Lys Lys Glu Tyr He Thr Leu Asn 
Asn Asn Asn Lys Asn Asn Asn Asn Lys Asn Asn Asp Asn Lys Asn Asn 
Asp Asn Asn Asp Tyr Asn Asn Asn Asn Ser Cys Asn Asn Leu Gly Glu 
Arg Ser Asn His Tyr Asp Asn Tyr Gly Gly Asp Asn Asn Asn Pro Cys 



- :i -: : : : : : • 

Asn Asn Asn Asn Asp Lys Tyr Asp lie Gly Lys Tyr Phe Lys Gin lie 
Asn Thr Phe lie Asn lie Asp Glu Tyr Lys Thr lie Tyr Gly Asp Glu 
lie Tyr Lys Glu lie Tyr Glu Leu Tyr Val Glu Arg Asn He Pro Glu 
Tyr Tyr Glu Arg Lys Tyr Phe Ser Glu Asp He Lys Lys Ser Val Leu 
Phe Asp lie Asp Lys Tyr Asn Asp Val Glu Phe Glu Lys Ala He Lys 
Glu Glu Phe He Asn Asn Gly Val Tyr He Asn Asn He Asp Asn Thr 
^k^^Tyr Tyr Lys Lys Glu Asn He Leu He Met Lys Lys He Leu His Tyr 
Phe Pro Leu Leu Lys Leu lie Asn Asn Pro Ser Asp Leu Lys Lys Leu 
Lys Lys Gin Tyr Leu Pro Leu Leu Ala His Glu Leu Lys He Phe Leu 
Phe Phe lie Val Asn lie Thr Gly Gly His Phe Ser Ser Val Leu Ser 
Ser Leu Glu He Gin Leu Leu Leu Leu Tyr He Phe Asn Gin Pro Tyr 
Asp Asn Val .He Tyr Asp He Gly His Gin Ala Tyr Val His Lys He 
Leu Thr Gly Arg Lys Leu Leu Phe Leu Ser Leu Arg Asn Lys Lys Gly 
^^Kle Ser Gly Phe Leu Asn He Phe Glu Ser He Tyr Asp Lys Phe Gly 
Ala Gly His Ser Ser Thr Ser Leu Ser Ala He Gin Gly Tyr Tyr Glu 
Ala Glu Trp Gin Val Lys Asn Lys Glu Lys Tyr Gly Asn Gly Asp He 
Glu He Ser Asp Asn Ala Asn Val Thr Asn Asn Glu Arg He Phe Gin 
Lys Gly He His Asn Asp Asn Asn He Asn Asn Asn He Asn Asn Asn 
Asn Tyr He Asn Pro Ser Asp Val Val Gly Arg Glu Asn Thr Asn Val 
Pro Asn Val Arg Asn Asp Asn His Asn Val Asp Lys Val His He Ala 



lie lie Gly Asp Gly Gly Leu Thr Gly Gly Met Ala Leu Glu Ala Leu 

Asn Tyr He Ser Phe Leu Asn Ser Lys He Leu He He Tyr Asn Asp 

Asn Gly Gin Val Ser Leu Pro Thr Asn Ala Val Ser He Ser Gly Asn 

Arg Pro lle Gly Ser He Ser Asp His Leu His Tyr Phe Val Ser Asn 



He Glu Ala Asn Ala Gly Asp Asn Lys Leu Ser Lys Asn Ala Lys Glu 



Asn Asn He Phe Glu Asn Leu Asn Tyr Asp Tyr He Gly Val Val Asn 
ly Asn Asn Thr Glu Glu Leu Phe Lys Val Leu Asn Asn He Lys Glu 

Asn Lys Leu Lys Arg Ala Thr Val Leu His Val Arg Thr Lys 'Lys Ser 



Asn Asp Phe He Asn Ser Lys Ser Pro He Ser lie Leu His Ser He 
Lys Lys Asn Glu He Phe Pro Phe Asp Thr Thr lie Leu Asn Gly Asn 
He His Lys Glu Asn Lys He Glu Glu Glu Lys Asn Val Ser Ser Ser 
Thr Lys Tyr Asp Val Asn Asn Lys Asn Asn Lys Asn Asn Asp Asn Ser 




Glu He He Lys Tyr Glu Asp Met Phe Ser Lys Glu Thr Phe Thr Asp 
He Tyr Thr Asn Glu Met Leu Lys Tyr Leu Lys Lys Asp Arg Asn He 



He Phe Leu Ser Pro Ala Met Leu Gly Gly Ser Gly Leu Val Lys He 

Ser Glu Arg Tyr Pro Asn Asn Val Tyr Asp Val Gly He Ala Glu Gin 

His Ser Val Thr Phe Ala Ala Ala Met Ala Met Asn Lys Lys Leu Lys 

He Gin Leu Cys He Tyr Ser Thr Phe Leu Gin Arg Ala Tyr Asp Gin 

He He His Asp Leu Asn Leu Gin Asn He Pro Leu Lys Val He He 



- 13 - • . . 

* • • • « 



« • • • 
• • • • • • « 

• • • • 



Gly Arg Ser Gly Leu Vai Giy Glu Asp Gly Ala Thr His Gin Giy lie 
Tyr Asp Leu Ser Tyr Leu Giy Thr Leu Asn Asn Aia Tyr lie lie Ser 
Pro Ser Asn Gin Vai Asp Leu Lys Arg Aia Leu Arg Phe Aia Tyr Leu 
Asp Lys Asp His Ser Vai Tyr lie Arg lie Pro Arg Met Asn lie Leu 
Ser Asp Lys Tyr Met Lys Gly Tyr Leu Asn lie His Met Lys Asn Glu 
Ser Lys Asn lie Asp Vai Asn Vai Asp lie Asn Asp Asp Vai Asp Lys 



Tyr Ser Glu Glu Tyr Met Asp Asp Asp Asn Phe lie Lys Ser Phe lie 

Gly Lys Ser Arg lie lie Lys Met Asp Asn Glu Asn Asn Asn Thr Asn 




Glu His Tyr Ser Ser Arg Giy Asp Thr Gin Thr Lys Lys Lys Lys Vai 
Cys rie Phe Asn Met Giy Ser Met Leu Phe Asn Vai lie Asn Ala lie 
Lys Glu lie Glu Lys Glu Gin Tyr lie Ser His Asn Tyr Ser Phe Ser 
lie Vai Asp Met lie Phe Leu Asn Pro Leu Asp Lys Asn Met lie Asp 
His Vai lie Lys Gin Asn Lys His Gin Tyr Leu lie Thr Tyr Glu Asp 



sn Thr lie Gly Gly Phe Ser Thr His Phe Asn Asn Tyr Leu lie Glu 



Asn Asn Tyr lie Thr Lys His Asn Leu Tyr Vai His Asn lie Tyr Leu 
Ser Asn Glu Pro lie Glu His Ala Ser Phe Lys Asp Gin Gin Glu Vai 
Vai Lys Met Asp Lys Cys Ser Leu Vai Asn Arg lie Lys Asn Tyr Leu 



Lys Asn Asn Pro Thr 



(5) ANGABEN ZU SEQUENZ ID NO: 5 
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Plasmodium falciparum gcpE-Gen 



(i) SEQUENZKENNZEICHEN: 

(D) LANGE: 2109 BASENPAARE 

(E) ART: genomische Sequenz 

(ii) ART DES MOLEKaLS: DNA 

(iii) URSPRONGLICHE HERKUNFT: 

{ B ) ORGAN I SMUS : Plasmodium falciparum 




FUNKTION: essentielles Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 5 

cagcctataaatattattatttattattatttttttttttttttttcataatgcctgaat 

QPINIIIYYYFFFFFS-CLN 
aaccacaaaatgagttatataaaaagactgattctttttatgttactgttttattctc^t 

NHKMSYIKRLILFMLLFYSH 
gtaaaaattaaaaaattatttattaaaatttctaatgtaaacatattttttgcagaagca 

VKIKKLFIKTSNVNIFFAEA 
aagaaaaatggaaaaaaggaattctttctttttttacCaaatataaaaaaaaaCagccaa 

KKNGKKEFFLFLLNIKKN3Q 
cagaaaaaaacttatcatattaccaaaaggaataccataaataaaagtgattttttatat 

QKKTYH ETKRNT ENK3DFLY 
tctttactaaacgaagaagggaactcttcaaaaaaggaatataaaaatttaaaagatgaa 

3LLNEEGN33KKSYKNLKDE 
gaaaaatataataccatacaaaatataaaaaaatattgtgaatgtactaaaaaatataaa 

EKYNI IQNIKKYCECTKKYK 
aggctcccaacacgagaagtagttattggaaatgttaaaattggaggaaataataaaata 

RLPTREVVIGNVKIGGNNKI 
gctattcaaaccatggctagctgtgatacaagaaatgtagaagaatgtgtatatcaaatt 

AIQTMASCDTRNVEECVYQI 
agaaaatgtaaagatttgggtgctgacattgtaaggttgactgttcaaggagttcaagaa 

RKCKDLGADIVRLTVQGVQE 
gcacaagctagttatcatattaaagaaaaattattatctgaaaatgtaaatatcccatta 

AQASYHIKEKLLSENVNIPL 
gtaacagatattcattttaatcctaaaatagctttaatggcagctgatgtgtttgaaaaa 

VTDIHFNPKIALMAADVFEK 
attcgagtgaatccaggaaattatgttgatggaagaaaaaaatggatagataaagtttat 

IRVNPGNYVDGRKKWIDKVY 
aaaactaaagaagaatttgatgaagggaaattatttataaaagaaaaatttgtaccatta 

KTKEEFDEGKLFIKEKFVPL 
attgaaaaatgtaaaagattaaatagagcaataagaattggtacaaatcatggattcctt 

lEKCKRLNRAIRIGTNHGFL 
tcatctcgagtattatcatattatggagatacaccattagcattagtagaaagtgctatg 

SSRVLSYYGDTPLALVESAM 
agattttctgatttatgtaatgaaaacaattttaacaatcttgttttttctatgaaagct 

RFSDLCNENNFNNLVFSM KA 
tctaatgcttatgttatgatacaatcttatagattattagtatctaaacaatatgaaaga 

SNAYVMIQSYRLLVSKQYER 
aatatgatgttccctatacatttaggagttacagaagcaggatttggtgataatggaaga 

NMMFPIHLGVTEAGFGDNGR 
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ataaaatcttatttaggtataggatctttattatatgatggtataggagataccattcgt 

IKSYLGIGS LLYDGrCDTIR 
atatccttaacagaagatccttgggaagagttaactccttgtaaaaaattagttgaaaat 

ISLTEDPWEELTPCKKLVEN 
ttaaagaaaagaatattttataatgaaaattttaaagaagataatgaattaaaaaataat 

LKKRIFYNENFKEDNELKNN 
gaaatggataccaaaaatctattaaattttgaagaaaattatcgaaattttaataatata 

EMDTKNLLNFEENYRNFNNI 
aaaaaaagaaatgtagaaaaaaataataatgtattacatgaagagtgcactataggtaat 

KKRNVEKNNNVLHEECTIGN 
g t a g t a a cc a t H aga a a g a L t c t c t g ca a a 1 1 1 1 1 aaa ga t^traaa t^t-a gaa 

VVTIKELEDSLQIFKDLNLE 
gtagattcaaatggaaatttgaaaaagggagccaaaacaactgatatggttattataaat 

VDSNGNLKKGAKTTDMVIIN 
gattttcataatataacaaatttaggaaaaaaaactgtggataaattaatgcaagtggga 

DFHNITNLGKKTVDKLMQVG 
attaatatagtagttcaatatgaaccacataatatagaatttatagaaaaaatggaacca 
INIVVQYEPHNIEFIEKMEP 
ataatgataataataataataataataataataatatattattttatgtggatataaaa 
NNDNNNNNNNNNILFYVDIK 
aatattatgaacagttcagaaaaaaatattaaattaagtaattctaaaggatatggatta 

NIMNSSEKNIKLSNSKGYGL 
attt taaacggaaaagaagatatacaaaccataaaaaaaataaaagaat taaatcgtcgt 

ILNGKEDrQTIKKIKELNRR 
cctttattcattctattaaaatcagataacatatatgaacatgta ttaataaccagaaga 

PLFILLKSDNIYEHVLITRR 
attaatgaacttttacaatccttaaatataaatataccttatatacattatgttgatatt 

INELLQSLNINIPYrHYVDr 
aattcaaataattatgatgatatattagttaattcaacattatatgcaggaagttgtttg 

NSNNYDDILVNSTLYAGSCL 
atggatttaatgggggatggtcttattgttaacgtaactaatgatgttcttacaaataaa 

MDLMGDGLIVNVTNDVLTNK 
aaagggtag 
K G - 



(6) SEQ ID NO: 6 

( i ) Sequenzkennzeichen : 

(A) Lange: 679 Aminosauren 

(B) Art: Aminosaure 

(ii) Art des Molekuls: Protein 
(iv) URSPRONGLICHE HERKUNFT: 

(A) ORGANISMUS: Plasmodium falciparum 



1 MSYIKRLILF MLLFYSHVKI KKLFIKISNV NIFFAEAKKN GKKEFFLFLL 

51 NIKKNSQQKK TYHITKRNTI NKSDFLYSLL NEEGNSSKKE YKNLKDEEKY 

101 NIIQNIKKYC ECTKKYKRLP TREWIGNVK IGGNNKIAIQ TMASCDTRNV 

151 EECVYQIRKC KDLGADIVRL TVQGVQEAQA SYHIKEKLLS ENVNIPLVTD 



201 IHFNPKIALM 

251 KEKFVPLIEK 

301 DLCNENNFNN 

351 GFGDNGRIKS 

401 RIFYNENFKE 

451 EECTIGNWT 

501 NITNLGKKTV 

551 LFYVDIKNIM 

601 ILLKSDNIYE 

651 LYAGSCLMDL 



AADVFEKIRV 
CKRLNRAIRI 
LVFSMKASNA 
YLGIGSLLYD 
DNELKNNEMD 
IKELEDSLQI 
DKLMQVGINI 
NSSEKNIKLS 
HVLITRRINE 
MGDGLIVNVT 



26 -: 



NPGNYVDGRK 
GTNHGFLSSR 
YVMIQSYRLL 
GIGDTIRISL 
TKNLLNFEEN 
FKDLNLEVDS 
WQYEPHNIE 
NSKGYGLILN 
LLQSLNINIP 
NDVLTNKKG- 



KWIDKVYKTK 
VLSYYGDTPL 
VSKQYERNMM 
TEDPWEELTP 
YRNFNNIKKR 
NGNLKKGAKT 
FIEKMEPNND 
GKEDIQTIKK 
YIHYVDINSN 



EEFDEGKLFI 
ALVESAMRFS 
FPIHLGVTEA 
CKKLVENLKK 
NVEKNNNVLH 
TDMVIINDFH 
NNNNNNNNNI 
IKELNRRPLF 
NYDDILVNST 
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Patentanspruche 



2. 




DNA-Sequenzen^ die fUr ein Polypeptid mit der in SEQ ID NO: 
2 dargestellten Aminosauresequenz codieren oder fur ein 
Analoges oder Derivat des Polypeptids gemali SEQ ID NO: 2, 
worin eine oder mehrere Aminosauren deletiert, hinzugefiigt 

nde-r,_Au,r_cLh_.ande:re_,_AmiiiQs,aunen_sj^ worden sind, oh- 

ne die enzymatische Wirkung des Polypeptids wesentlich zu 
reduzieren. 

DNA-Sequenzen^ die fur ein Polypeptid mit der in SEQ ID NO: 
4 dargestellten Aminosauresequenz codieren oder fiir ein 
Analoges oder Derivat des Polypeptids gemafi SEQ ID NO: 4, 
worin eine oder mehrere Aminosauren deletiert, hinzugefugt 
Oder durch andere Aminosauren substituiert worden sind, oh- 
ne die enzymatische Wirl-cung des Poiypeptids wesentlich zu 
reduzieren . 

DNA-Sequenzen, die fur ein Polypeptid mit der in SEQ ID NO: 
6 dargestellten Aminosauresequenz codieren oder fur ein 
Analoges oder Derivat des Polypeptids gemaft SEQ ID NO: 6, 
worin eine oder mehrere Aminosauren deletiert, hinzugefugt 
Oder durch andere Aminosauren substituiert worden sind, oh- 
ne die enzymatische Wirkung des Polypeptids wesentlich zu 
reduzieren. 

DNA-Sequenz gemafi einem der Anspruche 1 bis 3, dadurch ge- 
kennzeichnet, dafi sie aufterdem funktionelle Regulations- 
signale, insbesondere Promotoren, Operatoren, Enhancer, ri- 
bosomale Bindungsstellen, aufweist. 

DNA-Sequenz mit folgenden Teilsequenzen 

i) Promoter, der in Viren, Eukaryonten und Prokaryonten 
aktiv ist und die Bildung einer RNA im vorgesehenen 
Zielgewebe oder den Zielzellen sicherstellt, 

ii) DNA-Sequenzen gemSfl einem der AnsprUche 1 bis 3, 
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Lii) 3'-nichttranslatierte Sequenz, die in Viren, Eukaryon- 
ten und Prokaryonten zur Addition von Poly-A Resten an 
das 3^-Ende der RNA fuhrt. 

6. Verfahren zur Herstellung von transgenen Viren, Eukaryonten 
und Prokaryonten zur Veranderung des Isoprenoid-Gehaltes, 
dadurch gekennzeichnet, daB eine DNA-Sequenz gemaB Anspruch 

4 Oder 5 in das G^.nom von Viren. euk ^ryontischen und proka-_. 
ryontischen Zellen mit oder ohne Verwendung eines Plasmids 
transferiert und eingebaut wird. 

7. Expressionsvektor, enthaltend eine oder mehrere DNA- 
Sequenzen gemSB Anspruch 1 bis 3. 

8. Protein, welches am l-Deoxy-D-Xylulose-5-Phosphat- 

Stoffwechseiweges beteiiigt ist und a) codiert wird von der 
in DNA-Sequenz SEQ ID NO: L,3,5 oder b) codiert wird von 
DNA-Sequenzen, die mit den DNA-Sequenzen SEQ ID NO: 1,3,5 
Oder Fragmenten dieser DNA-Sequenzen Lrti DNA-Bereich, der 
fur das reife Protein codiert, hybridisieren . 

9. Protein nach den Anspruch 8, erhaltlich aus den Kulturuber- 
standen von Parasiten oder aus den aufgeschlossenen Pdrasi- 
ten und Aufreinigung iiber chromatographische und elektro- 
phoretische Techniken. 

10. Protein nach einem der AnsprUche 8 und 9, dadurch gekenn- 
zeichnet, dafi es a) das Produkt einer viralen, prokaryonti- 
schen Oder eukaryontischen Expression einer exogenen DNA 
ist, b) codiert wird von den Sequenzen SEQ ID NO: 1, 3 oder 
5 Oder codiert wird von DNA-Sequenzen, die mit den in den 
DNA-Sequenzen SEQ ID NO: 1, 3 oder 5 oder Fragmenten dieser 
DNA-Sequenzen im DNA-Bereich, der fUr das reife Protein ko- 
diert, hybiidisieren, oder c) codiert wird von DNA- 
Sequenzen, die ohne Degeneration des genetischen Codes mit 
den in b) definierten Sequenzen hybridisieren warden Und 
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fur ein Poiypeptid mit entsprechender Aminosaure-Sequenz 
kodieren. 



Protein gemafl einem der vorangehenden AnsprUchen, welches 
aus den Aminosauren von Sequenz SEQ ID NO: 2, 4 und 6 be- 
steht • 



Verfahren zur Bestiimnung der enzymatische Aktivitat des 
gcpE-Proteins, dadurch gekennzeichnet, dafi Phosphorylierung 
eines Zuckers oder eines Phosphorzuckers Oder einer Vdrstu- 
fe der Isoprenoidbiosynthese, insbesondere die Phosphory- 
lierung von 2-C-Methyl-D-erythritol, 2-C-Methyl-D- 
erythritol-phosphat, insbesondere 2-C-Methyl-D-erythritol- 
4-phosphat, 2-C-MethyI-D-erythrose, 2-C-Methyl-D-erythrose- 
phosphat, insbesondere 2-C-Methyl-D-erythrose-4-phosphat, 
und der Phosphat- und Alkohoivorstuf en, detektiert wird. 

Verfahren nach Anspruch L2, dadurch gekennzeichnet, dal3 die 
Phosphorylierung der foigenden Phosphate oder Alkohole de- 
tektiert wird: 

CH2 (OH) -C (CHa) =C (OH) -CH2-O-PO (OH) 2, 
CH2 (OH) -C (CH3) =C (OH) -CH2-OH, 

CH2 (OH) -CH (CH3) -CO-CH2-O-PO (OH) 2, CH2 (OH) -CH (CH3) -CO-CH2-OH 

CH2=C (CH3) -CO-CH2-O-PO (OH) 2, CH2=C (CH3) -CO-CH2-OH, 

CH2=C (CH3) -CH (OH) -CH2-O-PO (OH) 2, CH2=C (CH3) -CH (OH) -CH2-OH, 

CH2 (OH) -C (=CH2) -C (OH) -CH2-O-PO (OH) 2, 

CH2 (OH) -C (=CH2) -C (OH) -CH2-OH 

CHO-CH (CH3) -CH (OH) -CH2-O-PO (OH) 2, CHO-CH (CH3) -CH (OH) -CH2-OH, 

CH2 (OH) -C (OH) (CH3) -CH=CH-0-PO (OH) 2, 

CH2 (OH) -C (OH) (CH3) -CH=CH-OH 

CH (OH) =C (CH3) -CH (OH) -CH2-O-PO (OH) 2/ 

CH (OH) =C (CH3) -CH (OH) -CH2-OH 

Verfahren zum Screening einer Verbindung, wobei das Verfah- 
ren xjmfafit: 

a) Bereitstellen einer Wirtszelle, die einen rekombinanten 
Express ionsvektor enthalt, wobei der Vektor ziamindest 
einen Teil der Olignukleotidsequenz gemafl SEQ ID N0:1, 
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3EQ ID NO: 3 oder 3EQ ID MO: 5 Oder Varianten Oder Ana- 
loga dieser aufweist, and aufierdem eine Verbindung, von 
der verrautet wird, dafl sie eine antimykot ische, antibio- 
tische, antiparasitare oder antivirale Wirkung bei 
Mensch und Tier hat, 

b) In-Kontakt-Bringen der Wirtszelle mit der Verbindung und 

c) Bestimmung der antimikrobieilen, antimykotischen, anti- 
hi otls.cb.en^an.tiparaaLtar.ea_„oj±er^a_nJ:_i ^ Wirksamkeit 



der Verbindung. 

Verfahren zum Screening einer Verbindung, wobei das Verfah- 
ren umfaflt: 

a) Bereitstellen einer Wirtszelle, die einen rekombinanten 
Expressionsvektor enthalt, wobei der Vektor zumindest 
einen Teil der Olignukleot idsequenz gemafl SEQ ID N0:1, 
3EQ ID NO: 3 oder SEQ ID NO: 5 oder Varianten oder Ana- 
loga dieser aufweist, und aufierdem eine Verbindung, von 
der verruutet wird, dafi 3ie eine antimikrobielle, antivi- 
rale, antiparasitare, bakterizide, fungizide oder herbi- 
zide Wirkung bei Pflanzen hat, 

b) In-Kontakt-Bringen der Wirtszelle mit der Verbindung und 

c) Bestimmung der antimikrobiellen, antiviralen, antipara- 
sitaren, bakteriziden, fungiziden oder herbiziden Wirk- 
samkeit- der Verbindung. 



Klassischer Acetat/ 
Mevalonat-Pathway 
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Alternativer DOX-P 
Pathway 



(l-"q Glucose 
I 

p-"ci Triosephosphat 

i 



3x (2-"ci Acetyl-CoA 
i 



HOOC 



HOOC 



HMG-CoA 



-SCoA 



•OH 

Mevalonat (MVA) 



[1-"C] Glucose 
i 

[3."C] Glycerinaldehyd-3- 
phosphat 

= — ~ 

[3- C] pyruvat 

^ DOXP-Synthase 
=0 

HO— ^ 

—OH 
<K-OP 

l-Deoxyxylulose-5-P (DOX-P) 

I 

DOXP-Reduktoisomerase 



H, 




OH 
O OH 



•OP 



2 -C"Methylerythose-4 -phosphat 

1 



OP? 



Mevalonat-5-diphosphat 
I 




OH 
OH OH 




2-C-Methylerythritol-4-phosphat 



OPP 



gcpE ... 

IPP 



-OPP 



hQhere Pflanzen (Cytoplasmen) , 
Tiere, Pilze/ Eubakterien 

hohere Pflanzen (Plastide) , 
Fig- Griinalgen, viele Eubakterien 



